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Tema 2: Manejo de datos. 





En este tema: 
1.- Objetos para el manejo de datos. 


2.- Características de los objetos en R: modos y atributos. Datos 
especiales. 


3.- Asignación. Operadores lógicos. Coerción de tipos. 


4.- Vectores. Factores. Generación de secuencias regulares. Vectores de 
índices. 


5.- Variables indexadas (arrays). 
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Tema 2: Manejo de datos. 


También: 

6.- Matrices. Operaciones con matrices. 

7.- Listas. 

8.- Los data.frame u hojas de datos: las funciones attach y dettach. 
9.- Lectura de ficheros de datos. 


10.- Importar y exportar datos de otros programas. 
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1.- Objetos para el manejo de datos. 


o Res un lenguaje orientado a objetos: las variables, datos, funciones, 
resultados, etc., se guardan en la memoria activa del ordenador en 
forma de objetos con un nombre específico. 


o Podemos modificar o manipular estos objetos con operadores 
(aritméticos, lógicos y comparativos) y funciones (que a su vez son 
objetos). 

o Las estructuras de datos más usuales: variables, vectores, matrices, 


factores, variables indexadas, cadenas de caracteres, listas y data 
frames. 


o Existen otros como series temporales y es posible crear nuevas 
estructuras de datos. 


e Recordar el funcionamiento de objects(), 150) y rmO. 
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2.- Características de los objetos en R: modos y atributos. 
Los objetos están compuestos de elementos. Los elementos más simples, las 
variables, pueden ser: 


Tipos o modos de datos 


e numeric: número real con doble precisión. Los podemos escribir como 
enteros (3, -2), con fracción decimal (3.27) o con notación científica 
(3.12e-47). 


e complex: números complejos de la forma a+bi. 


eo character: Cadenas alfanuméricas de texto. 





o logical: variables lógicas. Puede ser TRUE o FALSE. 


Ejemplo 







nombre<-"Luis" 
varon<-TRUE 
edad<-23 
estatura<-1.77 


5/58 
Datos especiales: NA 's. 


o En algunos casos las componentes de un objeto pueden no ser 
completamente conocidas. 

e Cuando un elemento o valor es “not available” le asignamos el valor 
especial NA. 

eo En general una operación con elementos NA resulta NA, a no ser que 
mediante una opción de la función, podamos omitir o tratar los datos 
faltantes de forma especial. 

e La opción por defecto en cualquier función es na.rm=FALSE (que 
indica que NO elimina los NA), que da como resultado NA cuando 
existe al menos un dato faltante. 

e Con la opción na.rm=TRUE, la operación se efectúa con los datos 
válidos. 
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Datos especiales: NA 's. 


Ejemplo 


x<-NA 
Asignar NA a la variable x 


xl 
Observar que el resultado es también un NA. 


yc, 3 Dr) 
Asignamos al vector y dos NA y dos números. 


mean (y) 
Calcula la media teniendo en cuenta los NA's. 


mean (y,na.rm=TRUE) 
Calcula la media SIN tener en cuenta los NA's. 
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Datos especiales: Inf y NaN Ss. 


e En la mayoría de los casos, no debemos preocuparnos de si los 
elementos de un objeto numérico son enteros, reales o incluso 
complejos. Los cálculos se realizarán internamente como números de 
doble precisión, reales o complejos según el caso. 


o Para trabajar con números complejos, deberemos indicar 
explícitamente la parte compleja. 


e En determinadas ocasiones los cálculos realizados pueden llevar a 
respuestas con valor infinito positivo (representado por R como Inf) o 
infinito negativo (-Inf). 


o Es posible realizar y evaluar cálculos que involucren Inf. 


Sin embargo, a veces, determinados cálculos llevan a expresiones que 
no son números (representados por R como NaN's, del inglés “not a 
number”). 
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Datos especiales: Inf y NaN s. 
Ejemplo 
sqrt (-17) 
Produce un “Warning message” avisando que es un NaN. 


sqrt (-17+01) 
Calcula el resultado y devuelve un número complejo. 


x<-5/0 
Asignamos a x un valor infinito. 


exp(-x) 
Devuelve el valor 0. 


exp(x)-exp(x) 
Devuelve NaN: es una indeterminación. 
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Clasificación de los objetos en R. 


e Los objetos se pueden clasificar en dos grandes grupos: 


> atómicos: todos los elementos que los componen son del mismo tipo (o 
modo), como por ejemplo los vectores, matrices, series temporales. 

> recursivos: pueden combinar una colección de otros objetos de diferente 
tipo (o modo), como son los data.frame, listas. 


o Existen otras estructuras recursivas, p.e.: 


> El modo function está formado por las funciones que constituyen R, 
unidas a las funciones escritas por cada usuario. Las trataremos en un 
tema posterior. 

> El modo expression corresponde a una parte avanzada de R que 
trataremos más adelante al presentar las fórmulas en el tema de 
modelos estadísticos. 


o Recordar además que es posible crear nuevas estructuras. 


e Utilizando la función str(objeto) podemos obtener información 
sobre su estructura. 
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Atributos de los objetos. 


e Los atributos de un objeto suministran información específica sobre el 
propio objeto. 

o El modo o tipo de un objeto es un caso especial de un atributo de un 
objeto. Con el modo de un objeto designamos el tipo básico de sus 
constituyentes fundamentales. 


o Los atributos de un objeto suministran información específica sobre el 
propio objeto. Todos los objetos tienen dos atributos intrínsecos: el 
modo y su longitud. 

o Las funciones mode(objeto) y length(objeto) se pueden utilizar 
para obtener el modo y longitud de cualquier estructura. 


Ejemplo 

x<-c(1,3) 
mode(x) + Devuelve el tipo numeric 
length(x) $ Devuelve la longitud 





DET RATE TESEI UVA) Comp. y Prog. en R: Tema 2 11 / 58 


Atributos de los objetos. 


o Mediante attributes(objeto) podemos obtener una lista de los 
atributos no intrínsecos y con attr(objeto,atributo) podemos 
usar el atributo seleccionado (p.e. para asignarle un valor). 

e Los atributos son distintos según el tipo de objeto. Una pequeña lista 
de atributos es la siguiente: 


Atributos de cada tipo 


Atributo Tipos 
mode Todos 
storage.mode | Todos los datos de modo numérico 
length Todos 
names Vectores y listas 
dim Matrices y arrays 
dimnames Matrices y arrays 
tsp Series temporales 
levels Factores 
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Modificación de la longitud de un objeto 
e Un objeto, aunque esté vacío, tiene modo. 


Ejemplo 

v <- numeric() almacena en v una estructura vacía de vector numérico. 
character() es un vector de caracteres vacío, y lo mismo ocurre con otros 
tipos. 





o Una vez creado un objeto con un tamaño cualquiera, pueden añadirse 
nuevos elementos sin más que asignarlos a un índice que esté fuera del 
rango previo. 


Ejemplo 


v[3] <- 17 transforma v en un vector de longitud 3, (cuyas dos primeras 
componentes serán NA). 





o Esta regla se aplica a cualquier estructura, siempre que los nuevos 
elementos sean compatibles con el modo inicial de la estructura. 
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3.- Asignación. Operadores lógicos. Coerción de tipos. 


o Recordar que la función principal para definir un objeto es a través de 
sus componentes, con la función c(), mediante el comando más 
importante en R que es <- el de la asignación. 


o Las asignaciones pueden realizarse también con una flecha apuntando 
a la derecha, realizando el cambio obvio en la asignación. 


Ejemplo 
ASES es equivalente a > XA pero no a y<- 3 | 


o La asignación puede realizarse también mediante la función assign(). 


Ejemplo 
x<-c(1,3) es equivalente a assign("x", c(1, 3)) | 


e En muchos contextos el símbolo = puede también utilizarse 
indistintamente para asignar un objeto. 
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Asignación. 


e Si una expresión se utiliza como una orden por sí misma, su valor se 
imprime y se pierde. Así pues, la orden 1/x simplemente imprime el 
inverso de lo que sea el objeto x sin modificar su valor. 


o Podemos crear vectores con valores iniciales, FALSE, 0,0+01, " " 


mediante la función que indica el tipo de dato y entre paréntesis el 
numero de elementos a crear. 


Ejemplo 


x1<-logical (4) 
Inicializa un vector de longitud 4 cuyos elementos son FALSE 


x2<-numeric(4); x3<-complex(4) 
Inicializa (a 0) vectores numéricos de longitud 4 


x4<-character (4) 
Inicializa un vector de caracteres de longitud 4 
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Operadores lógicos. 


e Los elementos de un objeto de tipo lógico tienen dos posibilidades, 
FALSE o TRUE. Se pueden abreviar en F y T respectivamente. 


o Los objetos lógicos son generalmente fruto de una comparación. 


Ejemplo 

Si so 08 
y <- x>12 produce un objeto lógico de longitud la de x con valor F o V 
según se cumpla o no la condición (en este caso F) 





o Las comparaciones que dan un resultado lógico son: 
<,<=,>,>=,==,|=. 

o Los objetos lógicos se pueden utilizar con la aritmética ordinaria, en 
cuyo caso son transformados en vectores numéricos, FALSE se 
convierte en O y TRUE en 1. 
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Operadores lógicos. 


La aritmética entre objetos lógicos se puede llevar a cabo con los siguientes 
operadores lógicos: 


Operadores lógicos 





Operador | Operación 








lx Negación de x. Los T los convierte en F y viceversa. 
xél y Intersección, operador lógico y: 
T y T da T, otra comparación da F 
xly Unión, operador lógico o: 


F y F da F, otra comparación da T. 
xor(x,y) | Exclusivo OR, xor(T,F)==T, otra comparación da F. 











all Para una secuencia de argumentos lógicos, a11 devuelve 
el valor lógico que indica si todos los elementos son TRUE. 
any Para una secuencia de argumentos lógicos, any devuelve 








el valor lógico que indica si algún elemento es TRUE. 
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Operadores lógicos. 


Ejemplo 

0 e) 

AED) 

xg2y $ produce TRUE FALSE FALSE FALSE 
xl|y + produce TRUE TRUE TRUE FALSE 
xor(x,y) + produce FALSE TRUE TRUE FALSE 
any(x) + produce TRUE 

all(x) + produce FALSE 


ASIN ES) 

?outer * ayuda sobre el producto exterior de dos vectores 
outer(z,z,"8") 

cuter(z,z "") 
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Coerción de tipos. 


La mayoría de las funciones producen un error cuando el tipo de datos 
que esperan no coincide con los que ponemos en los argumentos. 


Tenemos dos posibilidades: 


> comprobar el tipo de datos utilizando funciones is.algo(), que nos 
responde con un valor lógico, 

> O forzar al tipo de datos deseados coercionando, para lo cual podemos 
utilizar funciones del tipo as.algo(), que fuerzan el tipo de datos. 


Para conocer si un elemento es NA, la comparación lógica ==, no 
puede funcionar ya que NA es la nada. Utilizamos para ello la función 
is.na(), que nos responde con un valor lógico: TRUE para los 


elementos del vector que son NA. 


o De manera similar, podemos utilizar is.finite(), is.nan(), etc. 
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Coerción de tipos. 
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Lista de los tipos más importantes que se pueden comprobar o forzar 














Tipo Comprobación Coerción 
array is.array() as.array() 
character | is.character() | as.character() 
complex is.complex() as.complex() 
double is.double() as.double() 
factor is.factor() as.factor() 
integer is.integer() as.integer() 
list is.list() as.list() 
logical is.logical() as.logical (O) 
matrix is.matrix() as.matrix() 
NA is.na() - 

NaN is.nan() - 

NULL is.null() as.null (O) 
numeric is.numeric() as.numeric() 
ts is.ts() as.ts() 
vector is.vector() as.vector() 
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Ejemplo 
x<-c(1:10) 


is.numeric(x) 
resulta en TRUE 


Te vector (%) 
resulta en TRUE 


is.complex(x) 
resulta en FALSE 


is.character(x) 
resulta en FALSE 


x<-as.character(x) 
lierza el vector = a tomar los valores ("1 "9 gan 


A 1pgn 00 007 UL 1gH OS 
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4.- Vectores. Factores. Generación de secuencias regulares. 
Vectores de índices. 


Características de los vectores 
o Extienden los tipos básicos 
o Concatenación de elementos 

o Todos los elementos del vector han de ser del mismo tipo 
o Se crean con la función c() 

o 


Se puede usar vector[5] para acceder al quinto elemento. 












Ejemplo 
nombre<-c("Luis", "María") $ Vector de caracteres 
edad<-c(23, 24) 

varon<-c(TRUE, FALSE); adult <- edad>18 
estatura<-c(1.77, 1.64) 
estatura[2] fDevuelve 1.64 
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Factores /Variables categóricas. 


e Un factor es un vector utilizado para especificar una clasificación 
discreta de los elementos de otro vector de igual longitud. 


o En R existen dos tipos de factores: 


> No ordenados (nominales): No existe jerarquía entre ellos (p.e., colores) 
> Ordenados (ordinales): Existe jerarquía entre ellos (p.e., grupos de 
edad) 


o Se pueden crear a partir de un vector numérico con las funciones 
as.factor(), as.ordered() o con la función g1(). 


o También a partir de un vector de caracteres utilizando factor(). 


o Las etiquetas se asignan con levels(). 


Ejemplo 
s$=ag tactor(c(l.,2,39,1,2.1,13,2)) REActorz cón 3 categorias 
levels(f)<-c("Bajo", "Medio", "Alto") 
ford<-as.ordered(f) + Factor ordenado 
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Vectores de caracteres: la función paste(). 


o R tiene algunos vectores de caracteres predefinidos: LETTERS, 
letters, month.name y month. abb. 


o La función paste() une todos los vectores de caracteres que se le 
suministran y construye una sola cadena de caracteres. Muy útil en 
gráficas. 

o También admite argumentos numéricos, que convierte inmediatamente 
en cadenas de caracteres. 


e En su forma predeterminada, en la cadena final, cada argumento 
original se separa del siguiente por un espacio en blanco, aunque ello 
puede cambiarse utilizando el argumento sep="*cadena””, que sustituye 
el espacio en blanco por cadena, la cual podría ser incluso vacía. 


Ejemplo 
labs <- paste(c("X","Y"),1:10,sep="") almacena, en labs, 
o AL ; UI mL ; 1 : Uan ; de : yo" z AA ; Y S! : O) , ENOTO 
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Generación de secuencias regulares. 


o R tiene grandes facilidades para generar vectores de secuencias de 
números. 

o El operador más usual es : que genera una secuencia desde: hasta en 
incrementos (o decremento si hasta es menor que desde) de uno. 

o Este operador tiene la prioridad más alta en una expresión. 

o La función seq() permite generar sucesiones más complejas. Dispone 
de varios argumentos (from, to, by, length). Existen funciones 
similares que realizan los cálculos más rápidamente (muy útiles a la 
hora de programar). Chequear la ayuda ?seq. 

o Una función relacionada es rep(), que permite duplicar un objeto de 
formas diversas. Su forma más sencilla es rep(x, times=5) que 
produce cinco copias de x, una tras otra. 

o La función sequence (nvec) genera secuencias de vectores 
concatenados. nvec es un vector de enteros que especifica los límites 
superiores de las secuencias que se generan. Todas comienzan en uno 
y se van concatenando en un vector resultante. 
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Generación de secuencias regulares. 


Comprobar las siguientes expresiones: 


Ejemplo 
pi:1 
seq(0,1,length=10) 

seq(3) + equivale a 1:3 y a seq(1,3) 
seq(1,5,by=0.5) 

=11/0 

rep(1:4,2) 

rep(1:4,c(2,3,1,2)) 

rep(1:4,c(2,2)) + error, tamaños no coinciden 
sequence (c(2,3)) 
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Extrayendo muestras de un vector. 


o R nos permite seleccionar muestras de un vector utilizando la función 
sample (x,size,replace=FALSE,prob): 

o Obtiene una muestra de tamaño size de x, con o sin reemplazamiento, 
pudiendo tener los elementos de x probabilidades distintas a la 
uniforme (por defecto). Si x tiene longitud 1, se considera el vector 
13x. 


Ejemplo 

x<-c(1:10) 

sample (x,3) 

sample(x) + Permutaciones de los elementos de x 
y<-sample(5:15,5) 

y 
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Vectores de índices. 


e R nos permite seleccionar subconjuntos de elementos de un vector 
añadiendo al nombre del vector un vector índice entre corchetes []. 


o El vector índice puede ser de tres tipos distintos: 


Q Un vector lógico: en este caso el vector índice debe ser de la misma 
longitud que el vector del cual queremos seleccionar elementos. Los 
valores correspondientes a TRUE en el vector índice son seleccionados, 
los correspondientes a FALSE omitidos. 

Q Un vector de números enteros: en caso de ser positivos, los 
correspondientes elementos indicados en el índice son concatenados, 
mientras que si son negativos los valores especificados son omitidos. No 
hace falta que sea de la misma longitud que el vector de donde 
seleccionamos. 

9 Un vector de nombres. Esta posibilidad se aplica cuando el objeto tiene 
el atributo names que identifica sus componentes. La función names 
permite añadir etiquetas (o nombres) a un vector numérico. 


o La función which() genera un vector numérico con las posiciones 
seleccionadas. 
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o Vectores índice lógicos: 


Ejemplo 

x<-c(0,NA,1,2) 
y<-x[!tis.na(x)] 
GA) Mis .na(x) € x>01 







=> z 





o Vectores de números enteros: 


Ejemplo 
xs letters [cts 11587915) 

paste (letters[c(13,1,18,9,15)],collapse="") 
5) 








o Vector de nombres: 


Ejemplo 

frutos<-c(5,10,1,20) 
names (frutos)<-c("pera","banana",'"melon",'"naranja") 
postre<-frutos[c("pera","melon")] 
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Más sobre vectores de índices. 


Ejemplo 

x<=0: 10 

sum(x) 

length (x) 
sum(x<b) 

x [x<5] 

sum(x [x<5] ) 
length (x [x<5]) 
sum(xx*(x<5)) 
sum(which(x<5b)) 

















z<-numeric(10) 
id<-which(x<5) 
z[id] <- x[x<5] 
Zz[which(x<5)] <- x[x<5] $ equivalente al anterior (¿mejor?) 
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5.- Variables indexadas (arrays). 


e Una variable indexada (array) es un objeto con elementos todos del 
mismo tipo con un atributo adicional (dim) el cual a su vez es un 
vector numérico de dimensiones (números enteros positivos) formado 
por varios índices. Vectores y matrices son casos particulares. 

e Los elementos del vector de dimensiones indican los límites superiores 
de los índices. Los límites inferiores siempre valen 1. 

o Existen dos maneras de crear una variable indexada: 


Q Un vector puede transformarse en una variable indexada cuando se 
asigna un vector de dimensiones al atributo dim. 


Ejemplo 
z<-numeric(1500); dim(z) <- c(3,5,100) | 


Q Utilizando la función array(vector de datos,vector de 


dimensiones) 
Ejemplo 
h<-numeric(24); Z <- array(h, dim=c(3,4,2)) | 
51/58 


Más sobre variables indexadas (arrays). 


o Al igual que en Fortran, la creación de la variable indexada sigue la 
regla de que el primer índice es el que se mueve más rápido y el último 
es el más lento. 


Ejemplo 
Si se define una variable indexada, a, con vector de dimensiones c(3,4,2), 
la variable indexada tendrá 3x4x2 = 24 elementos que se formarán a partir 


de los elementos originales en el orden a[1,1,1], a[2,1,1], ..., 
MA Te 





o Para referirnos a un elemento de un array daremos el nombre de la 
variable y, entre corchetes, los índices que lo refieren, separados por 
comas. 


Ejemplo 
a 1 AA DA | 
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Más sobre variables indexadas (arrays). 


o Podemos referirnos a una parte de un array mediante una sucesión de 
vectores índices, teniendo en cuenta que si un vector índice es vacío, 
equivale a utilizar todo el rango de valores para dicho índice. 


Ejemplo 

a[2,,] es una variable indexada 4x2, con vector de dimensión c(4,2) cuyos 
elementos son (2 alo ais a aa al 
a[2,2,21, a[2,3,21, a[2,4,2]1) en ese orden. 





al[,,] equivale a la variable completa; coincide con a. 


o Si especificamos una variable indexada con un solo índice o vector 
índice, sólo se utilizan los elementos correspondientes del vector de 
datos, y el vector de dimensión se ignora. 


Ejemplo 
a[2] sería el elemento 2 del vector a, es decir el a[2,1,1] del array | 
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6.- Matrices. Operaciones con matrices. 


eo Las matrices son un caso particular de array con dos dimensiones: un 
objeto con un atributo adicional el cual a su vez es un vector numérico 
de longitud 2, que define el número de filas y columnas de la matriz. 


e Todos los elementos deben ser del mismo tipo. 


o Una matriz se define con el comando matrix() especificando el 
número de filas y columnas o asignando la dim a un vector. 


eo Recordar que la matriz se crea por columnas, aunque con la opción 
byrow=TRUE lo hace por filas. 


o Podemos asignar nombres a las filas y columnas con el atributo 
dimnames. 


o Las funciones is.matrix() y as.matrix() comprueban o fuerzan el 
carácter de matriz de un objeto. 
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Más sobre matrices. 


o La situación más sencilla es la de seleccionar unas determinadas filas 
con un vector y unas columnas con otro vector, siguiendo las reglas 
comentadas en los arrays. 


o R tiende a reducir complejidad: al seleccionar una columna, el objeto 
resultante es un vector y no una matriz. Para mantener las 
dimensiones, añadir drop=F. 


o Podemos seleccionar elementos de una matriz poniendo entre 
corchetes otra matriz, de las mismas dimensiones que la original, con 
valores lógicos que indicarán con TRUE los elementos a considerar. 


e Cuando se realizan operaciones que mezclan variables indexadas 
(matrices, p.e.) y vectores conviene tener en cuenta que si asignamos 
un vector más corto a una matriz, se extiende repitiendo sus elementos 
(lo que se denomina reciclado) hasta alcanzar el tamaño deseado. 
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Más sobre matrices. 


Ejemplo 
x<=c (1:06) 
dim(x)<-c(2,3) 
dimnames (x)<-list(c("Fila1","Fila2"),c("Col1","Co12","Co13")) 
ejema<-matrix(1:12,nco1=3,byrow=T, 

dimnames=1ist (letters[1:4],LETTERS[1:3])) 
ejema[1,1] 
ejema[,c(2,3)] 
ejema[,c(-1,-3),drop=F] 
sel<-matrix(repí(c(T,F),6),4,3) 
ejemal[sel] 
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Más sobre matrices. 


Funciones útiles para trabajar con matrices 




















Función Utilidad 
ncol (x) Número de columnas de x. 
nrow(x) Número de filas de x. 
1 (x) Transpuesta de x 
cbind(...) Combina secuencias de vectores/matrices por col?s. 
ld) Combina secuencias de vectores/matrices por filas. 
diag(x) Extrae diagonal de matriz o crea matriz diagonal. 
col(x) Crea una matriz con elemento ij igual al valor j 
row(x) Crea una matriz con elemento ij igual al valor i 
apply(x,margin,FUN,) Aplica la función FUN a la dimensión especificada 
en margin 1 indica filas, 2 indica columnas. NB. 
outer(x,y,fun="x") Para dos vectores x e y , crea una matriz 
otra forma x %o %y A[i,31=FUN(x[31,y[j1). 
Por defecto crea el producto externo. 
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Más sobre matrices. 


Algunas operaciones con matrices 


Utilidad 

Multiplicación de matrices 

Idem que t(x) %* hy, pero más rápida 
Matriz de varianzas-covarianzas 
Matriz de correlaciones 


Función 

x /* y 

crossprod(x,y=x) 
cov(x,y=x,use="all.obs") 
cor(x,y=x,use="all.obs") 








scale(x,center=,scale=) Resta a las columnas la media si center=TRUE, 
Si center es un vector, resta dichos valores. 
Idem para scale ,luego de centrar, pero divide 
por la desviación tipica si scale=TRUE o los 
valores asignados si es un vector. 


Descomposición de Choleski. 





chol (x) 
solve(a,b,tol=1e-7) 





Resolución de la ecuación a%x%x=b. 
tol=tolerancia para detectar dependencias 
lineales en las columnas de a 

eigen(x) 
sdv(x) 


Cálculo de valores y vectores propios. 
Descomposición en valores singulares. 
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Más sobre matrices. 


Ejemplo 
x<-matrix(1:6,2,3) 

2 

Al 

y<-matrix(1:6,3,2) 

y Sl 

ncol(x); nrow(y) 

t(x) 

ebind (1) 

ebind IES SÓN) 

diag(x) $ no es necesario que la matriz sea cuadrada 
apply (x,1,sum) 
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7.- Listas. 


o Una lista es un objeto consistente en una colección ordenada de 
objetos que se suelen llamar componentes. 


o No es necesario que los componentes sean del mismo modo, ni de la 
misma longitud: una lista puede estar compuesta de, por ejemplo, un 
vector numérico de tamaño 2, un valor lógico, un vector de tamaño 3, 
una matriz y una función. 


o Se construyen con la función list () o concatenando otras listas. 

e Son una parte importante de la programación de funciones en R. 

e Los componentes siempre están numerados y pueden ser referidos por 
dicho número, o por su nombre (si lo tiene, por defecto no lo tiene). 


o Debemos ir con mucho cuidado al seleccionar partes de la lista: 


> La selección de elementos se hace con doble corchete o con el nombre 
del elemento precedido del símbolo del dólar. 

> Pero si utilizamos el corchete simple estamos considerando una sublista 
(de menos componentes) de la lista. 
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Más sobre listas. 


Ejemplo 

ejemplolista <- list(nombre="Pedro", casado=T, 
esposa="María",no.hijos=3, edad.hijos=c(4,7,9)) 

ejemplolista 

ejemplolistal[5] 

is.vector(ejemplolista[l5]); is.list(ejemplolistal5]) 

ejemplolistal[![5]] 

is.vector(ejemplolista[[51]1); is.list(ejemplolistal[[5]]) 

ejemplolistal[[5]] [2] 

ejemplolista[![5]] 

ejemplolistafcasado 

ejemplolistafnombre 

is.recursive(ejemplolista) 

is.atomic(ejemplolista) + vemos el tipo de objeto 

listamasgrande <- c(ejemplolista,list(edad=40)) 
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0- Los data. Frame 


eo Las bases de datos en estadística son, habitualmente de la forma: 








Covariables 
individuo  anyos implante edad sexo 
1 1.3 2 2) H 
2 0.4 2 21 M 
3 1.1 2 34 H 
4 243 1 42 H 
5 3.1 3 17 M 
6 1.3 1 43 H 





o R organiza este tipo de información en objetos del tipo data.frame, 
un caso particular de lista. 


o Los data.frame son apropiados para describir “matrices de datos” 
donde cada fila representa a un individuo y cada columna una variable, 
cuyas variables pueden ser numéricas o categóricas. 
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8.- Hojas de datos o data.frame 


e Los data.frame se crean con la función data.frame(): 


Ejemplo 
datosimp <- data.frame(anyos=c(1.3,0.4,1.1,2.3,3.1,1.3), 
tapo=e(2,9,3,1,3,1) ,edad=c(22,21,34,42, 171,43), 
sexo=c("'H" ; "mM" , 0075 pób , po ; mM" 2 AO 





e Las componentes deben ser vectores (numéricos, carácter o lógicos), 
factores, matrices numéricas u otros data.frames. 


o Puesto que un vector representará una variable del banco de datos y 
las columnas de una matriz representarán varias variables de ese 
mismo banco, la longitud de los vectores debe ser la misma y coincidir 
con el número de filas de las matrices. 


e Los datos que no son numéricos, la estructura de data.frame los 
considera factores, con tantos niveles como valores distintos 
encuentre, tal y como ocurre en el ejemplo que estamos considerando. 
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Las funciones attach() y detach(). 


o Para trabajar con las variables del banco de datos, podemos utilizar la 
notación estándar de las listas, £nombre o [[ ]], pero resulta más 
natural emplear simplemente el nombre de la columna. 


o El problema es que R guarda el nombre del data.frame pero no sus 
variables. Para poderlas utilizar con su nombre como vectores, 
tenemos que utilizar la función attach(nombre de data.frame). La 
operación inversa se realiza con la función detach(). 


o En cualquier momento es posible llevar a cabo un filtrado de datos 
utilizando expresiones lógicas (por ejemplo, para seleccionar de un 
banco de datos sólo los que son mayores de 65 años) y vectores 
índices. 


o En el caso de los data.frames es posible seleccionar filas y columnas 
deseadas, y crear con ellas otros data.frame con las características 
deseadas con la función subset (). 
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Funcionamiento de attach(), detach() y subset(). 


Ejemplo 

datosimp <- data.frame(anyos=c(1.3,0.4,1.1,2.3,3.1,1.3), 
tipo=c(2,3,3,1,3,1),edad=c(22,21,34,42,17,43), 
sexo=c( "HA" "M”. "E" "HO MA) 

anyos 

attach(datosimp); anyos 

detach(datosimp); anyos 

datos.hombre.filtrados <- datosimpfanyos [datosimp$sexo==*H?] 

mas.peq <- subset(datosimp,anyos<1,select=c(edad,sexo)) 












45/58 
Transformaciones. 


e En cualquier momento, podemos modificar o manipular cualquier 
objeto con operadores (aritméticos, lógicos y comparativos) y 
funciones. Así, por ejemplo, si una variable no es normal, puedo 
transformala para conseguir dicha normalidad. 


o ¡Cuidado! Cualquier modificación que hagamos con las variables de un 
banco de datos “adjuntado” (attached) no afectarán al propio 
data.frame. 

e Si queremos modificar el contenido interno de los data.frames 
podemos utilizar la función transform(). En concreto podemos: 

> Transformar variables existentes (para conseguir normalidad, por 
ejemplo). 

> Crear nuevas variables mediante la transformación de variables 
existentes. 
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Recodificaciones. 


o Mediante la función recode() de la librería car es posible llevar a 
cabo recodificaciones de otras variables. 


o Debemos especificar cuál es la variable a recodificar, cuáles son los 
criterios de recodificación y si deseamos que la nueva variable 
resultante de la recodificación sea un factor o no. 


o ¡Cuidado! Las recodificaciones tampoco afectarán al propio 
data.frame. 
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Funcionamiento de transformaciones y recodificaciones. 


Ejemplo 










attach(datosimp) 

edad.final <- edad + anyos * no afecta al data.frame 

datosimp.1 <- transform(datosimp, edad.final = edad+anyos) tt si afecta 
datosimp.2 <- transform(datosimp.1, edad = edad+1) tt altera la variable 
install.packages("car"); library(car) $ Instalar y cargar paquete 
edc<-recodel(edad," 15:25=*joven?; 26:65=*adulto? ", as.factor.result=T) 
sexo.cod<-recode(sexo," *H?*=0 ; ?M*=1 ", as.factor.result=TRUE) 
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9.- Lectura de ficheros de datos. 


o Hasta ahora hemos visto cómo introducir datos interactivamente en 
forma de objetos, aunque habitualmente los datos nos vienen 
proporcionados en archivos externos. 

e Como los requisitos de lectura de R son bastante estrictos, muchas 
veces conviene modificar el archivo de datos externo con otros editores 
de texto (como WinEdt, etc.). 

o Para asignar un banco de datos a un data.frame se utiliza la función 
read.table(). La forma más sencilla es con un fichero en el que: 

> La primera línea del archivo debe contener el nombre de cada variable 
de la hoja de datos. 
> En cada una de las siguientes líneas, el primer elemento es la etiqueta 


de la fila, y a continuación deben aparecer los valores de cada variable. 
Si no, R asigna automáticamente etiquetas a las filas. 


Ejemplo 
ratas<- read.table(file="F:/Datos/ratas.txt", header=T) | 
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La función scan) . 


o La función scan() es más genérica que la anterior, y vale para asignar 
cualquier tipo de objetos (vectores, matrices, listas, etc.). 


o Si el segundo argumento es un sólo elemento, todos los elementos del 
archivo deben ser del tipo indicado y se leen en un sólo vector. 


Ejemplo 


En su uso más básico la función scan() permite introducir los valores 
interactivamente. 


x<- scan() 
li 


En el prompt nos va pidiendo valores que se van incorporando al vector 
hasta que pulsamos intro y acaba. Probar a introducir 1, 5, 8 y 3. 
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Ejemplo 











Supongamos que el fichero “entrada.txt” contiene los datos de tres 
vectores, de igual longitud, el primero tipo carácter y los otros dos tipo 
numérico, escritos de tal modo que en cada línea aparecen los valores 
correspondientes de cada uno de ellos: 


entrada<- scan("entrada.txt", list("",0,0)) 


Podemos referirnos a los vectores con: 
esaquera senadora eS 
entrada[[3]] 


También podríamos haber utilizado: 

entrada <- scan("entrada.txt", list(etiqueta="",x=0,y=0)) 

lo que nos permitiría utilizar la notación $ para referirnos a los vectores: 
etiqueta <- entradafetiqueta; x <- entrada$x; y <- entrada$y 
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Otras formas de leer y guardar datos. 


o La función save(objetos, list = character(0), file = 
"nomfich.ext", ascii = FALSE) nos permite guardar los objetos 
que queramos en el nomfich.ext. 


o load() nos permite leer datos de un fichero binario que contiene los 
objetos de R previamente guardados con save(). 


e Como vimos en el primer tema, cuando cerramos R existe la 
posibilidad de guardar todos los objetos de la sesión de trabajo en 
archivos .RData. 

o En realidad, al grabar toda la imagen R está aplicando la función 
save .image(), un caso particular de la función 
save (list=1s(),file=".Rdata"). 

o Al cargar los datos desde el menú Archivo>cargar área de 
trabajo o hacer doble click sobre el fichero .RData en el fondo 
estamos utilizando la función load(). 
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Otras formas de leer y guardar datos. 


e Aunque no es muy elegante, siempre es posible guardar el flujo de 
comandos de R que contiene la definición de un data.frame y luego 
recuperarlo con la función source () que vimos en el primer tema. 


o data() lista los bancos de datos disponibles en el package datasets, 
mientras que data(package = .packages(all.available = 
TRUE)) lista todos los disponibles en las librerías que hayamos cargado 
anteriormente. 


o La función data(nom.banco.datos) carga el banco de datos para 
que podamos utilizarlo. 


o Existen dos funciones más para guardar datos: 


Q write() que guarda en un fichero texto vectores y matrices que luego 
se pueden leer con scan() y 

Q vrite.table() que guarda también en fichero texto los data. frame 
para leerlos luego con read.table(). 
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10.- Importar y exportar datos de otros programas. 


o La gran aceptación de R está haciendo cada vez más fácil el importar 
ficheros de otros programas. 


o La librería foreign contiene funciones para importar y exportar datos 
en el formato de otros programas. 


eo Utilizando help(package="foreign") podemos encontrar una lista 
de funciones y formatos soportados de otros programas estadísticos 
(SPSS, SAS, STATA, Minitab, SPlus, Epilnfo, Systat) y numéricos 
(Octave). 


Ejemplo 
library(foreign) + Cargamos el paquete 


datos<-read.spss(file="glucosa.sav", to.data.frame=TRUE) 
strídatos) 
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Importar y exportar datos de otros programas. 


o Existen otras opciones (ver el manual R-data incluido en el material y 
la web http: //cran.r-project.org/) para conectar R con 
diferentes bases de datos (Access, Excel, MySQL, dBase, etc.). 


o La idea es utilizar lo que se conoce como “Open DataBase 
Connectivity” (ODBC), un estándar de acceso a bases de datos 
utilizado por la mayoría de bases de datos existentes. 


o A través de ODBC, un sistema puede conectarse a cualquier base de 
datos (que esté local en nuestro ordenador o incluso que esté remota) 
que soporte ODBC sin necesidad de conocer sus características 
específicas. Para ello, el desarrollador de la base de datos es el 
encargado de crear el driver de ODBC necesario para que su base de 
datos pueda ser utilizada desde ODBC. 


o En el caso de R, existe una librería llamada RODBC que permite 
conectarse mediante un ODBC y desarrollar consultas contra bases de 


datos. 
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Caso particular: importar datos de Excel 


La librería RODBC permite conectarse mediante un ODBC a un fichero excel. 


Comandos tipo para conectar con Excel 


library(RODBC) + Cargamos el paquete 
conexion<-odbcConnectExcel ("dedos.xl1s") 
Datos<-sqlQuery(channel=conexion,"select * from [Hoja1$]") 
close(conexion) 





o La segunda línea establece una conexión ODBC con el archivo 
dedos.xls utilizando la función odbcConnectExcel (). 


o La tercera línea selecciona la Hojal de ese archivo de Excel. Datos 
pasa a ser un data.frame de R. 


o La cuarta línea cierra la conexión, que ya no es necesaria. 
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La mejor opción importar datos de Excel si se tiene 
instalado excel es evitar conexiones externas. 


Preparar datos en Excel 


o La tabla a exportar debe estar en la esquina superior izquierda 


o No puede haber más datos en esa hoja de Excel 





Exportar a fichero ASCII 


o Selección Fichero— >Salvar como 


o Seleccionar “Formato CSV” (o personalizado) 
o Seleccionar formato de exportación: 


Carácter para delimitar cadenas de texto 
Símbolo de los decimales 
Símbolo para separar columnas 





mportar datos en R 
Leer con read.table(), read.csv() o read.csv2() | 
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Licencia de este material | 


Más info: http: //creativecommons.org/licenses/by-sa/3.0/es/ 


Usted es libre de: 


copiar, distribuir y comunicar públicamente la obra 
hacer obras derivadas 


Bajo las condiciones siguientes: 












Reconocimiento. Debe reconocer los créditos de la obra de la mane- 


ra especificada por el autor o el licenciador (pero no de una manera 
que sugiera que tiene su apoyo o apoyan el uso que hace de su 









obra). 
Compartir bajo la misma licencia. Si transforma o modifica esta 
obra para crear una obra derivada, sólo puede distribuir la obra 
resultante bajo la misma licencia, una similar o una compatible. 
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